Record Linkage: Zusammenführung von Daten auf Basis des Modells von Fellegi und Sunter

نویسنده

  • Josef Schürle
چکیده

Gegenstand der Arbeit ist die automatisierte Zusammenführung von Daten mit dem Ziel, Einheiten, welche in verschiedenen Datensätzen enthalten sind, zu identifizieren. Die Motivation für eine derartige Vorgehensweise kann vielfältig sein. So ist ein mögliches Ziel, verschiedene Informationsquellen wie Datenbanken oder Register zu einer zu vereinen. Oder es kann angestrebt werden, aus vorhandenen Daten zusätzliche Informationen zu gewinnen und somit eine aufwendige und teure primärstatistische Erhebung zu vermeiden. In manchen Bereichen beispielsweise bei der Erforschung von Krankheitsverläufen ist eine primärstatistische Informationsgewinnung oft gar nicht möglich. Durch die Verknüpfung verschiedener Datensätze wird in diesen Fällen ein Zugang zu den gewünschten Informationen überhaupt erst realisierbar.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Dublettenbereinigung nach dem Record Linkage Algorithmus

Unter Dublettenbereinigung versteht man das Entfernen mehrfach gespeicherter Datensätze, die auf dasselbe Objekt verweisen. Der bekannteste Algorithmus hierzu ist der Record Linkage Algorithmus nach Fellegi und Sunter. Hierbei wird ein Gesamtgewicht auf Grundlage eines Vergleichs einzelner Attribute von zwei Datensätzen errechnet. Neben dem exakten Vergleich von Attributen sind vor allem Algori...

متن کامل

Entwicklung und Analyse eines Modells zur raum­zeitlichen Modellierung von Umweltinformationen auf Basis von Crowdsourcing

Die flächenhafte Modellierung von Umweltinformationen, wie meteorologischen Daten und Luftschadstoffinformationen, basiert im Wesentlichen auf den Daten administrativer Messnetze, die eine nur vergleichsweise grobe räumliche und zeitliche Auflösung aufzuweisen haben. Dazu gehören beispielsweise Messnetze der Landesämter sowie des Deutschen Wetterdienstes (DWD). Insbesondere in urbanen Umgebunge...

متن کامل

Das Modell von Burns und Scapens am Beispiel der IT-Auslagerung bei einem öffentlichen Unternehmen

Der kontinuierliche Wandel in Unternehmen führt auch zu Anpassungen im Controlling. Dies betrifft bei IT-Outsourcing Projekten das ITControlling. Bisher findet sich noch keine eindeutige Antwort darauf, ob und warum ein solcher Wandel im IT-Controlling gelingt bzw. nicht gelingt. Auf Basis des Modells von Burns/Scapens [1], das einen strukturationstheoretischen Ansatz zur Interpretation von Ver...

متن کامل

Zusammenführung der konzeptuellen Modelle für operative und analytische Daten in einem logischen Modell, dargestellt am Beispiel des Precision Dairy Farming

Die als Ergebnis der konzeptuellen Datenmodellierung im Rahmen des Precision Dairy Farming vorliegenden getrennten Modelle für operative und analytische Daten sind in ein logisches Modell zu überführen. Wir propagieren dabei den Entwurf eines gemeinsamen relationalen Modells für beide Datensichten. Nur so kann Redundanz und Inkonsistenz auf Modellund Datenebene vermieden werden. Anhand eines Be...

متن کامل

Datenintegration zwischen Standards in der Landwirtschaft auf Basis semantischer Technologien

Obwohl die Standardisierung von Datenformaten und Austauschmechanismen für Informationen im Agrarsektor und angrenzenden Bereichen inzwischen gute Fortschritte gemacht hat, ist nach wie vor eine mangelhafte Integration von Daten aus verschiedenen Quellen zu beobachten. Semantische Technologien können dabei helfen, diesen Missstand zu beheben indem sie Methoden bereitstellen, mit verschiedenen s...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2004